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Evaluez ( r) les stages 

L a phrase-titre a ete prononcee par des representants d’etudiants en medecine au 
cours d’une reunion recente avec des responsables des facultes. Le ton utilise 
par Tetudiant laissait persister un doute sur le sens de son propos. S’agissait-il d’eva- 
luer les stages pratiques, notamment du point de vue de leur valeur formatrice ou bien 
etait-il question d’evaluer les capacites d’un etudiant [en cours] au terme d’un stage ? 

La suite a montre que les deux aspects etaient en cause. 

Evaluer et noter les etudiants dans le cadre de leurs stages hospitaliers ou ambula- 
toires et ainsi donner une plus grande importance a leur formation pratique est une 
ambition ancienne trop souvent evoquee puis differee dans son application. 

Pourtant, au cours des annees 1990, les arretes successifs 1,2 organisant le deuxieme 
cycle des etudes medicales avaient installe le principe d’une epreuve pratique de 
« mise en situation » organisee chaque annee ou au terme de chaque stage. 

Tout recemment, Tarrete du 10 octobre 2000 a precise que les notes de stage doivent 
tenir compte de T inevitable assiduite mais aussi du comportement des etudiants. 
Enfin, ce meme arrete indique la necessite d’un carnet de stage regroupant les preuves 
« de T acquisition d’un certain nombre de gestes pratiques et de comportements ». . . 

Ainsi, le dispositif par lequel la formation pratique des etudiants pourrait etre veri- 
tablement prise en compte est en place. Theoriquement, les etudiants pourraient 
desormais echouer a une annee de deuxieme cycle, non pas en raison d’une insuffi- 
sance aux examens theoriques mais a cause d’une formation clinique negligee. 

Evidemment, ces excellentes intentions restent a mettre en pratique. Elies corres- 
pondent cependant a une volonte reelle de nombre de responsables universitaires qui 
avaient souhaite, au cours des dernieres annees, remplacer le concours de Tinternat 
par un classement etabli a partir des notes de faculte incluant les notes de stages hos- 
pitaliers. Une telle evolution aurait naturellement provoque un changement radical 
des habitudes de travail des etudiants en medecine en revalorisant brutal ement le tra- 
vail « au lit du malade ». Une fois de plus l’adage nord-americain « evaluation drives 
curriculum » aurait ete verifie. 

Anterieurement, le psychologue et pedagogue americain E.-L. Thorndike 3 avait deja 
observe que le comportement des etudiants etait principalement determine par la 
nature des epreuves qu’ils devaient reussir. Ainsi, les etudiants ont tendance a inten- 
sifier leurs activites dans la mesure ou ils connaissent le succes. Ce phenomene est 
connu sous le terme de Loi de l’effet (de Thorndike). Les etudiants sont conscients 
que certains types de comportement sont associes au succes, a savoir de bonnes notes 
d’examens. C’est ainsi que, si un professeur fait subir des epreuves qui exigent de la 
memoire, Tetudiant apprendra par cceur. En revanche, si une epreuve exige des etu- 
diants qu’ils appliquent des principes, qu’ils interpretent des donnees et qu’ils resol- 
vent des problemes, alors ils etudieront en vue d’etre aussi bien prepares que possible 
pour reussir ce type d’epreuve : a la longue, le systeme devaluation utilise determine 
dans une large mesure le type d’activite educative a laquelle les etudiants se livreront 
pendant Tenseignement. 

Finalement, l’acces au troisieme cycle par un examen sur epreuves ecrites a ete main- 
tenu, au motif principal de la mefiance des candidats potentiels devant une procedure 
non anonyme et de surcroit assez delicate a mettre en oeuvre. 

II reste que la mise en oeuvre d’evaluation(s) des stages aussi bien sur le versant struc- 
ture de formation que sur celui de Tactivite des etudiants pose une question de 
methodes : comment faire ? 


LA REVUE DU PRATICI EN 200 1, 51 


2229 


TOUS DROITS RESERVES - LA REVUE DU PRATICIEN 


Redacteur en chef : 

J.-F. Cordier (Lyon) 

Secretaires 
de redaction : 

J.-L. Dubois-Rande (Creteil) 
F.Jacq (Paris) 

Conseiller 
pedagogique : 

J.-M. Chabot (Paris) 


Pour memoire, quel que soit son 
objet, une procedure devaluation 
doit se do ter de trois qualites prin- 
cipales : avant tout sa validite, puis 
sa commodite, enfin sa fiabilite 
(voir encadre). Evaluer les stages 
implique done d’ identifier les cri- 
teres qui font le « bon » stage, tout 
comme evaluer le stagiaire revient 
a definir les caracteristiques du 
comportement et les competences 
du stagiaire « ideal ». Des lors que 
ces criteres (standards) sont iden- 
tifies, il suffit de les regrouper 
dans des grilles ou carnets. Pour 
chaque critere, le jugement a por- 
ter par les examinateurs peut etre 
simplement binaire \Oui ou Non, 
ou encore Fait ou Non fait], 

Cependant dans bon nombre de 
cas, il est preferable d’utiliser des 
echelles depreciation qui per- 
mettent de porter un jugement 
plus « qualitatif ». Ces echelles 
sont generalement appelees de 
type Likert, du nom du psycho- 
logue qui en 1932 decrivit parmi 
les premiers cet instrument 
d’ evaluation. 4 

De nos jours, les echelles de type Likert sont utilisees largement dans toutes sortes de proce- 
dures devaluation depuis la satisfaction des malades jusqu’a l’analyse des besoins de forma- 
tion en passant par l’applicabilite de nouvelles recommandations therapeutiques. La plupart 
des instituts de sondage en ont egalement fait leur outil privilegie. 

Pour l’essentiel, une echelle de type Likert est generalement constituee de 5 niveaux (ramenes 
a 4 niveaux, sans point median, des lors qu’il s’agit de susciter des opinions) dont un point median 
correspondant a un avis indifferent. Des collegues de R. Likert avaient montre au cours des 
annees 1930 que la fiabilite des echelles atteignait un maximum avec 7 niveaux de jugement. 

En pratique, il convient de trouver le meilleur compromis possible entre la validite et la fiabi- 
lite de l’instrument de mesure ; e’est la raison pour laquelle des echelles a 9 ou 1 1 niveaux, qui 
peuvent paraitre plus sensibles ou precises, sont en fait moins fiables. 

Pour finir, il ne faut surtout pas negliger la commodite de l’instrument de mesure, qui doit etre 
aise a mettre en oeuvre. C’est pourquoi les carnets de stage qui sont actuellement elabores, ou 
sur l’autre versant, les grilles devaluation (de la valeur formatrice) des stages, doivent etre faci- 
lement utilises par ceux dont c’est la responsabilite, meme si les donnees recueillies paraissent 
trop partielles ou frustes. Car ce qui compte dans un premier temps c’est d’« installer » la pro- 
cedure devaluation. Il sera temps ensuite de la rendre plus exhaustive. 


L a validite signifie que la procedure ou la methode utilisees vont 
effectivement permettre de correctement mesurer/apprecier 
ce que Ton souhaite evaluer (la definition du terme « validite » du 
Larousse parle du degre de precision avec lequel un test mesure 
vraiment ce qu’il a pour objet de mesurer). 

Par exemple.si Ton souhaite evaluer la maniere dont un mede- 
cin interprete une radiographie, il faut mettre ce medecin en 
situation d’interpreter cette radiographie, et I’observer, sans 
quoi la validite sera mauvaise. 

Pour aller un peu plus loin, les specialistes de la science metro- 
logique diraient que la validite est essentiellement constituee 
de precision, d’exactitude et de sensibilite. 

De son cote, la commodite signifie que la procedure ou la tech- 
nique sont assez aisees a mettre en oeuvre et qu’elles ne sont 
pas trop couteuses. Si Ton ne craint pas les neologismes, on peut 
dire que la commodite est constituee de praticabilite et d’ac- 
ceptabilite. A titre d’exemple, il faut douter de la commodite 
d’un examen oral que devrait passer une promotion de I 000 
etudiants alors que le jury serait constitue par 3 membres, par 
ailleurs professeurs de renommee mondiale venant de differents 
pays. 

De plus, les procedures et techniques devaluation doivent 
autant que possible posseder une troisieme qualite qui est I’en- 
semble «objectivite/fiabilite»,ce qui signifie que la mesure effec- 
tuee est juste et reproductible et que le resultat obtenu n’est 
pas dependant des circonstances. (On parle ici devaluation sanc- 
tionnante ou certifiante ou sommative. Dans le cas de revalua- 
tion formative [ formative assessment], la « fiabilite/objectivite » 
n’a evidemment pas la meme importance.) 


1 . Arrete du 4 mars 1 997 relatif a la 2 e partie du deuxieme cycle des etudes medicales. 

2. Arrete du 10 octobre 2000. JO n° 241 du 17 octobre 2000, p. 16482. 

3. Thorndike EL. http ://encarta. msm.com 

4. Likert RA. Technique for the measurement of attitudes. Arch Psychol 1932 ; 140. 
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